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摘 要 : 针对 二 部 图 网 络 结构 推荐 算法 中 资源 分 配 不 合理 的 现象 ， 同 时 为 了 丰富 推荐 结果 多 样 性 和 促进 冷门 物品 的 推 

荐 ， 提 出 了 一 种 利用 差异 路 径 权重 改变 资源 传递 的 二 部 图 网 络 结构 算法 。 利 用 用 户 相似 性 构造 路 径 权 重 改 变 第 一 阶段 
资源 传递 规则 ， 使 资源 较 多 地 流向 与 目标 用 户 相似 的 用 户 节 点 。 通 过 物品 属性 相似 的 构造 路 径 权 重 ， 使 第 二 阶段 资源 

更 多 地 流向 与 目标 用 户 已 购物 品 具 有 相似 属性 的 物品 。 实 验 结果 表明 ， 本 算法 相对 于 其 他 流行 网 络 结构 算法 提高 了 推 

荐 的 综合 性 能 ， 并 且 更 好 地 解决 推荐 中 的 相关 问题 。 
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Recommendation algorithm for bipartite graph network structure 
based on differential path weight 


Gao Changyuana bp, Duan Wenbin’, Zhang Shuchena， 
(a. College of Economic & Management, b. High-tech Industrial Development Research Center, Harbin University of Science 
& Technology, Harbin 150040, China) 


Abstract: This paper is aimed at the unreasonable allocation of resource in the recommendation algorithm of bipartite network, 
and in order to enrich the diversity of recommended results and promote the recommendation of unpopular items. This paper 
proposes the algorithm for bipartite graph network structure, which uses differential path weight to change resource delivery. It 
changes the first stage of resource transfer rules by user similarity to construct path weights and make the resources flow more 
towards the user nodes similar to the target users. Through the consideration of constructing path weight of the articles attributes’ 
similarity, the second stage resources are more likely to flow to the objects which have similar attributes with the target users' 
purchased products. Experimental results show that the proposed algorithm improves the combination property of 
recommendation, and better solves the related problems in recommendation, which outperforms other popular network structure 
algorithms. 
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CBRA)JPD 、 基 


于 知识 的 推荐 算法 (knowledge-based 


0 三 
引言 recommendation algorithms, KBRA)JBI、 基 于 二 部 图 网 络 结构 推 
随 着 互联 网 的 快速 发 展 ， 社 会 和 企业 信息 化 的 逐步 成 熟 ， 荐 算法 (bipartite network structure recommendation algorithms, 
越 来 越 多 的 数据 通过 多 种 终端 产生 并 服务 于 人 们 的 生活 之 中 。 BNSRA) 中 。 其 中 二 部 图 网 络 结构 推荐 算法 由 于 推荐 物品 多 样 性 


海量 的 数据 随 之 而 来 引发 了 “信息 过 载 ”问题 叫 , 致使 能 满足 用 较 好 且 不 受 物品 种 类 的 限制 , 越 来 越 受 到 研究 推荐 的 学 者 欢迎 。 
户 需 求 的 推荐 系统 迅速 发 展 。 推 荐 算法 是 推荐 系统 中 极为 重要 前 CFRA 的 研究 较为 系统 并 且 众 多 电子 商务 平台 也 使 
的 一 个 模块 ， 主 要 负责 选择 符合 用 户 兴趣 的 信息 或 者 物品 并 推 该 算法 ， 但 是 部 分 学 者 经 过 大 量 实 验证 实 了 BNSRA 在 推荐 效 
荐 给 用 户 ， 前 主流 的 推荐 算法 有 协同 过 滤 推 荐 算法 ， 率 和 精准 度 上 较 优 于 传统 的 CFRAJ 册 。BNSRA 将 系统 中 存在 上 

(collaborative filtering recommendation algorithms, CFRA )、 基 用 户 和 物品 虚拟 化 为 二 部 图 网 络 中 的 点 ， 系 统 中 的 购买 关系 天 
于 内 容 的 推荐 算法 (content-based recommendation algorithms, 成 了 网 络 中 点 之 间 的 连 线 。 目 前 越 来 越 多 研究 推荐 的 学 者 尝试 
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录用 稿 


对 BNSRA 进行 优化 研究 ， 随 着 扩散 动力 学 与 热传导 


的 引入 ， 


BNSRA 主要 转向 了 基于 物质 扩散 的 BNSRA (material diffusion 


bipartite network, MDBN ) [I 和 基于 热传导 的 BNSRA (heat 


conduction bipartite network, HCBN)II 两 大 改进 方向 。 
的 学 者 也 主要 从 改进 初始 资源 分 配 四、 


个 性 


化 BI、 


考虑 时 间 效 应 0 以 及 组 合算 法 


消除 元 余 属 性 、 


并 且 不 同 
降低 流行 性 、 满 足 用户 
考虑 物品 内 容 bo、 基 于 社团 划分 6、 
局 等 八 个 角度 去 优化 提高 
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Chin 
高 长 元 全 和 


其 中 : ko) 为 物品 节点 0 的 度 ， 即 物品 0; 被 选择 的 数量 。 第 二 阶 
段 资源 会 由 用 户 层 的 每 个 用 户 节点 经 过 选择 关系 流向 物品 层 ， 


则 物品 节点 0 的 资源 量 为 
f0) -Se O) 
3 Kk(u) 也 气 RK) ee 酒 
其 中 : kl) 为 用 户 节点 的 度 , 即 用 户 购买 物品 数 。w 表示 物品 
。 对 o 推荐 的 资源 贡献 量 。 针 对 具体 的 目标 客户 ， 将 物品 按照 
新 资源 量 由 大 到 小 排序 ， 取 排序 中 前 工 个 物品 作为 推荐 系统 中 
E 荐 给 目标 用 户 的 推荐 结果 。 


2 ”改进 的 二 部 图 网 络 结构 推荐 算法 


引入 用 户 相似 性 构建 路 径 权重 

二 部 图 网 络 结构 推荐 算法 第 一 阶段 中 间 多 和 
分 配 ， 没 有 考虑 到 不 同 用 户 间 的 兴趣 差异 ， 若 购 买 同一 物品 的 
用 户 间 评分 不 同 ， 则 用 户 对 于 该 物品 的 喜好 也 存在 差异 。 文 献 
[16,17] 通 过 聚 类 区 分 用 户 兴趣 差异 ， 改 变 资源 传递 规则 提高 了 
算法 的 精确 度 。 在 资源 传递 第 一 阶段 中 ， 物 品 资源 量 更 应 该 传 
递 到 和 目标 用 户 喜好 类 型 和 程度 较为 相似 的 用 户 点 。 因 此 ， 本 
文 借助 Jaccard 系数 , 通过 对 系统 中 用 户 评分 差 均 值 wwerase(c,O) 


2.1 


BNSRA 性 能 ， 并 且 丰 富 算法 推荐 物品 种 类 以 及 弥补 冷门 物品 
推荐 上 的 不 足 。 
有 前 传统 的 推荐 算法 通常 倾向 于 将 比较 流行 的 物品 推荐 给 
用 户 ， 然 而 并 没有 顾及 到 用 户 需求 多 样 化 。 因 此 ， 丰 富 推荐 物 
品种 类 的 多 样 性 以 及 增加 对 冷门 物品 的 推荐 ， 对 于 推荐 系统 向 
更 多 用 户 服务 才 更 有 实际 意义 。 基 于 此 ， 本 文 利用 用 户 相似 性 
构建 二 部 图 网 络 结构 资源 传递 路 径 权重 ， 改 变 传统 资源 均等 伟 
递 情况 提高 推荐 的 精准 度 。 同 时 ， 为 了 提高 推荐 结果 多 样 性 和 
二 = ”对 冷门 物品 的 推荐 ， 本 文通 过 对 物品 间 属 性 海 明 距离 计算 ， 改 
» 变 资 源 从 用 户 向 物品 传递 的 规则 ， 增 加 推荐 物品 种 类 。 通 过 实 
) 。 验 验证 了 本 文 算法 在 推荐 结果 精准 度 以 及 算法 的 综合 性 能 都 得 
忆 到 提升 。 
FE 1 ”基于 二 部 图 网 络 结构 推荐 算法 
© 二 部 图 网 络 结构 推荐 算法 认为 ， 用 户 已 购买 的 物品 具有 向 
用 户 推荐 其 他 物品 的 能 力 ， 这 种 能 力 是 物品 依据 被 选择 的 情况 
@D 赋予 一 定 的 资源 量 ， 通 过 用 户 -物品 网 络 向 其 他 物品 进行 传递。 
GN 假设 目标 用 户 w 购买 了 系统 中 的 部 分 物品 , 则 开始 时 赋予 每 
之 个 已 购物 品 的 资源 量 为 1。 假 设 一 个 系统 中 存在 m 种 物品 和 
< 位 用 户 ， 设 0={0,0,,0…0,} 代表 系统 中 的 mn 种 物品 ， 
2 -tu 代表 系统 中 的 位 用 户 。 则 整个 系统 中 的 物品 
三。 和 用 户 可 以 构成 一 个 "行列 的 关系 矩阵 4， 其 中 
加 “= 上 23… 四 ，c= 人 L23… 可 。 关 系 矩阵 wu 的 取 值 如 下 所 示 : 
E | 选择 过 商品 o， 
” ”|[0,ww 未 选择 商品 o， 
当 a =1 时 ， 用 户 w 和 物品 "之 间 形 成 一 条 连 线 ， 同 时 物 
品 0 被 赋予 了 一 个 单位 的 资源 量 ， 若 未 被 选择 ， 则 初始 资源 量 
为 零 。 二 部 图 网 络 结构 资源 传递 过 程 如 图 1 所 示 。 
1 19/24 
5/24 
a We > 3/8 
1 5/8 
图 1 二 部 图 网 络 结构 资源 传递 过 程 
初始 资源 从 物品 层 经 过 物品 与 用 户 的 选择 关系 平均 分 配 到 
用 户 层 。 经 过 第 一 阶段 的 资源 变动 ， 用 户 获得 的 资源 量 为 


f= > 


Ko (D) 


的 计算 获取 用 户 间 差异 函数 D(a,pB) 。Jaccard 相似 性 系数 可 定义 
为 
|LNDl 
sime, =| 03) 
1 和 包 表示 用 户 u、w 对 于 其 已 购物 品 中 具有 实际 评分 
的 项 目 数 量 ， 当 Jaccard 相似 性 系数 越 大 时 ， 则 认为 、ws 共同 
评分 的 项 目 数量 较 多 ， 他 们 兴趣 一 致 的 可 能 性 较 大 即 相 似 性 较 
大 。 对 uy 间 共 同 评分 项 目的 分 值 进 行 做 差 


Do ={d,dy…di…dy} ， 其 中 为 w、 


ris Tp 差 的 绝对 值 ， 即 d; =| 7 — a | » 


wy 在 第 i 种 物品 的 评分 数 
N 表示 wu。、w 共同 评分 的 


个 数 。 则 用 户 间 评分 差 值 的 均值 为 
地 
average(a,D) = a = (4) 
为 了 能 起 到 调节 Jaccard 相似 性 系数 的 作用 ,使 其 能 达到 用 


户 评分 差距 小 时 系数 升 高 的 效 


户 间 评 分 差距 大 时 系数 降低 ， 用 


果 。 对 不 同 用 户 评分 差 均 值 进 行 归 一 化 处 理 ， 并 且 去 除 评分 细 
量 影响 ， 得 到 用 户 间 差异 函数 为 
De =1_ Hes p) (5) 


Tax — Thin 


= 间 已 购买 的 所 有 物品 中 最 大 的 评分 数值 ， 部 
为 最 小 的 数值 。 通 过 对 Do,D) 计算 ， 就 可 以 借助 Jaccard 系数 构 
以 性 函数 sim(@,p) : 

ILNL| 
[1 UL 
利用 sim(a,p) 构造 第 一 阶段 路 径 权重 5 ,从 而 使 得 和 目标 
以 性 比较 高 的 用 户 节 点 能 够 获得 更 多 的 资源 值 。 其 计算 
式 如 下 : 


昌 
过 
a 
未 
Sr 
二 
工 


Si11(Q,D)= 一 一 Da,O) (0) 


| 
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录用 稿 
Sun = ussim(G, 月 
Pasim(a,l) 0) 
So 表示 用 户 ws 和 目标 用 户 w 的 相似 度 占 所 有 选择 了 商 


品 0; 的 用 户 与 目标 用 户 w 的 相似 度 之 和 的 比例 。 Sm 的 结果 在 
[0,1] 内 ，Ss 较 大 时 ， 表 示 在 所 有 已 经 购买 " 的 用 户 群 体 中 ， 目 
标 用 户 与 用 户 ww 比 其 他 用 户 与 较为 相似 ， 则 物品 0; 上 的 
初始 资源 就 会 较 多 的 传递 到 4 。 

若 在 系统 中 , 以 uz 作为 目标 用 户 , 则 物品 or 在 改进 路 径 权 
重 后 的 第 一 阶段 资源 传递 变化 如 图 2 所 示 。 


Sq1xX S421X S441X 


阶段 资源 传递 变化 


图 2 第 一 


2.2 引入 物品 相似 性 构建 路 径 权重 

用 户 选 取 物品 时 可 能 物品 的 某 些 属性 致使 用 户 购买 ， 不 同 
物品 间 虽 然 种 类 不 同 ， 但 会 有 一 部 分 相似 属性 ， 利 用 这 些 属性 
可 以 扩展 推荐 物品 的 种 类 以 及 极 个 别 冷门 物品 。 因 此 ， 物 品 属 
性 相似 性 研究 对 推荐 系统 改进 具有 一 定 的 实际 意义 。 一 些 学 者 
通过 物品 标签 作为 二 部 图 扩展 ， 提 高 推荐 性 能 5034。 如 果 进 行 物 
品 相似 性 计算 ， 不 同属 性 权重 不 同 ， 如 果 人 为 设 定 权重 值 ， 会 
导致 数据 不 平滑 的 现象 .本 文 利 用 格雷 编码 表示 不 同 的 属性 值 ， 
通过 计算 海 明 距离 区 分 不 同 物品 间 差 异 ， 避 免 了 人 为 属性 权重 
设 定 ， 通 过 算法 的 自学 习性 自动 的 分 析 不 同属 性 的 作用 大 小 。 


荆 


Sp 
:人 Ey 
构造 资源 从 用 户 到 物品 传递 路 径 的 权重 8 ， 从 而 使 得 和 目标 
用 户 已 选择 的 物品 相似 性 比较 高 的 物品 节点 能 够 获得 更 多 的 资 
源 值 。 8 表示 物品 0; 和 目标 用 户 uw 已 选择 的 物品 0; 的 相似 度 
用户 ws 所 有 选择 的 物品 o 与 物品 0; 相似 度 的 比例 , 其 计算 公 
式 如 下 : 


高 长 元 ， 


Sim(i, )) 
[9 一 一 一 一 
. Dagsim(i,t) 4D) 
若 在 系统 中 , 以 uz 作为 目标 用 户 , 针对 用 户 wa 已 选择 物品 


0 时 , 则 改进 路 径 权重 后 的 第 二 阶段 资源 传递 变化 如 图 3 所 示 。 


(Qa335421t 
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介 段 资源 传递 变化 


假设 选 定 用 户 w 为 目标 用 户 为 其 推荐 物品 , 其 已 购买 物品 
0; 初始 资源 量 定 为 1， 则 传递 到 用 户 ww 的 资源 量 为 


f (ug) = 2 Sapa (12) 


随后 资源 


和 户 ww 传递 到 物品 0%; 后， 物品 0 的 资源 量 为 


—— 


f(0) =Y Ona f (uy) (13) 
pa 


于 目标 用 户 所 选择 的 物品 初始 资源 量 经 过 两 轮 资 源 传递 
后 ,就 可 以 得 到 每 个 物品 节点 新 的 资源 量 , 选取 物品 的 f(0)) 值 


对 于 物品 属性 ， 首 先 对 每 个 属性 确定 其 分 类 个 数 N ， 确 定 
该 属性 的 编码 位 数 n=1bN ， 对 于 一 个 物品 的 不 同属 性 值 进行 
且 连 接 成 格雷 编码 串 &w ， 对 两 物品 间 的 Bi 进行 海 
明 距 离 差 异 比较 得 出 不 同 物品 的 属性 差异 量 Diw(i,) 。 
Dim (i 7) = Dm (Broms Buow) (8) 
其 中 : Diw(i,j) 表示 物品 0; 和 o; 的 海 明 距 离 差 异 量 , 假设 物品 o 
属性 串 为 Bww=(0101000000) ， 物 品 o 的 属性 串 
Bu =4100010100)， 则 Diwti, 户 =4 。 为 了 能 起 到 与 D(a,pP) 同等 的 


效果 ， 对 不 同 物品 属性 的 海 明 距离 值 进 行 归 一 化 处 理 ， 并 且 去 
除 差 异 纲 量 影响 ， 得 到 物品 属性 差异 函数 DG,j) 如 下 : 
DG,)) =1- Qt) 


其 中 : ”Dim 为 物品 0; 与 0; 属 性 的 海 明 距离 的 最 大 值 。 物 品 属 
二 二 全 能 够 将 描述 物品 特征 的 属性 尽 可 能 考虑 到 物品 相似 
度 计 算 中 ， 有 助 于 丰富 推荐 物品 的 种 类 。 将 物品 属性 差异 函数 
DG 六 引入 到 Jaccard 相似 性 系数 中 ， 就 可 以 得 到 物品 相似 度 函 
数 simli,) 为 


[i sy (10) 
[TUT| 


Sim(i, 7 = 


其 中 : 7 和 分 别 表示 物品 0 和 0; 的 特征 属性 数 。 


通过 Sim(i, ]) 


进行 由 大 到 小 顺序 排列 并 将 前 工 个 物品 推荐 给 用 户 。 


3 ”算法 详细 步骤 


利用 上 述 不 同 的 差异 路 径 权重 改进 的 BNSRA 具体 步骤 如 
下 : 
输入 用 户 评分 矩阵 所， 物品 属性 表 P， 目 标 用户 4 


输出 : 用 户 必 推荐 列表 。 
a) 通过 用 户 评分 矩阵 建立 用 户 与 物品 的 二 部 图 网 络 G, 并 
计算 用 户 的 度 e。 
b) 在 网 络 G 中 通过 式 (3) 可 以 得 到 不 同 的 用 户 Jaccard 系 
数 ， 并 计算 用 户 评 分 差 均值 ave 。 
c) 根据 ave 和 Jaccard 系数 ,通过 
权重 s. 


式 (7) 计算 第 一 阶段 路 径 


进行 与 或 运算 得 到 物 
品 建 属性 差异 量 Dw ， 及 最 大 差异 量 Darme 。 

e) 通过 表 P 获取 两 物品 间 的 属性 并 交 数 量 , 利用 
计算 出 第 二 阶段 路 径 权 重 2。 

f) 通过 式 (13) 计算 出 传递 后 物品 节点 的 资源 量 。 

g) 将 物品 资源 量 按照 由 大 到 小 排列 ,去 除 已 购物 品 ， 取 前 
工 个 最 为 推荐 列表 ， 算 法 结束 。 


式 (11) 
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本 文 算法 的 时 间 复 杂 度 分 析 : 假定 系统 中 有 n 个 用 户 ，m 
种 物品 ， 在 过 程 a) 中 可 离线 求 出 用 户 的 度 ， 其 时 间 复 杂 度 为 
O(n ; 在 过 程 b) 中 由 于 Jaccard 系数 和 用 户 评分 差 均值 可 以 离 


线 计算 , 所 以 第 一 阶段 路 径 权 重复 杂 度 为 00m) 也 可 通过 离线 计 


aXN 合 合作 期 刊 ， 


Chi 
。 基于 关 异 到 很 风量 的 岂 拓 间 加 中 推出 : 


算 。 过 程 d) 中 直接 离线 通过 数据 处 理 即 可 ， 随 后 在 进行 第 


阶段 路 径 权 重 计 算 时 复杂 度 为 Oo”), 但 是 也 可 以 离线 运算 。 最 
后 通过 两 阶段 资源 传递 计算 物品 节点 新 的 资源 量 时 的 时 间 复 杂 
度 为 O(n ,所 以 本 文 算法 在 计算 过 程 中 时 间 复 杂 度 为 0(n:m) ， 
n 为 用 户 数 ，m 为 物品 数 。 


4 ”实验 数据 及 评价 指标 


4.1 实验 数据 
本 文 的 实验 数据 选取 GroupLens 研究 组 的 MovieLens 数据 
集中 943 位 用 户 对 1682 部 电影 的 10 万 条 评价 信息 , EachMovie 


数据 集中 72 916 位 用 户 对 1628 部 电影 的 评价 信息 以 及 Netflix 
数据 集中 480 189 位 用 户 的 17770 部 电影 的 评分 数据 进行 实验 。 


4.2 评价 指标 

a) 海 明 距 离 (Hamming distance，H) 可 以 作为 检测 系统 推 
荐 物品 种 类 多 样 性 的 一 个 重要 指标 。L 表示 推荐 列表 长 
表示 w 和 ww 推荐 结果 中 相同 物品 个 数 , 对 于 整个 系统 推荐 物品 
种 类 多 样 性 可 表示 为 


县 ， Cu 


1 Qup 
5= > 4 了 ) 


m(m—1) 3 
5 越 大 表明 系统 推荐 物品 的 种 类 较 多 。 
b) 流行 性 (Popularity，<k> ) 能 反映 出 系统 对 于 相对 冷门 
物品 推荐 的 情况 。 推 荐 系统 的 流行 性 可 利用 推荐 物品 度 的 均值 


<> 表 示 ， 如 果 <k> 较 高 ， 则 说 明 推荐 物品 中 的 流行 物品 较 多 。 
物品 度 的 平均 值 <k> 可 以 表示 为 


的 = 走光 Delo) 


其 中 4 表示 用 户 的 数量 。 

c) 准确 率 (precision, P) 为 推荐 结果 中 目标 | 
品 占 比 。P 的 结果 越 大 表示 算法 的 准确 率 越 高 。 
如 下 : 


户 己 购买 物 
P 的 计算 公式 


p= fractptipfp 
AD 


其 中 : fraciptpfp 是 指 已 推荐 的 物品 中 用 户 已 购物 品 的 数量 ， 
nfillQ) 是 指 推荐 物品 数量 。 
d) 召回 率 (recall，R) 为 捅 


中 
四 


户 已 购买 物品 


E 荐 结果 中 目标 / 


的 个 数 与 目标 用 户 购 买 物品 总 数 的 比值 ，R 的 结果 越 大 表示 算 
法 的 召回 率 越 高 。R 的 计算 公式 如 下 : 
R= facpiphn 
hfil1(2) 


其 中 : fractptpfr 指 的 是 推荐 列表 中 用 户 已 经 选择 的 物品 数量 ， 
nfil1(2) 是 指 用 户 所 有 选择 的 物品 数量 的 总 和 。 
e) 综合 评价 指标 (F-measure ) 衡量 推荐 系统 的 综合 表现 的 


指标 ， 常 用 P 和 R 的 加 权 调 和 平均 值 表示 ， 其 公式 为 
Po si: 
P+R 
Fl 常 作为 衡量 算法 推荐 能 力 的 标准 ，F1 值 越 大 表明 算法 
荐 效果 越 佳 。 
5 ”实验 结果 及 分 析 


实验 参照 基准 算法 如 下 : 本 文 算法 基于 差异 路 径 权重 
(differential path weight，DPW ) 二 部 图 网 络 推荐 算法 ， 协 同 过 
滤 推 荐 算法 〈collaborative filtering，CF )， 基 于 网 络 推理 的 算法 
(network-based inference, NBI) 四, 异 质 热 
heat conduction, HHC) 二 分 网 络 推荐 算法 I 和 ,热传导 和 物质 扩 
散 结 合 的 混合 推荐 算法 (hybrid method of heat conduction and 
mass diffusion, HHM) {51。 
首先 , 在 算法 的 推荐 结果 多 样 性 能 力 上 , 如 图 4 所 示 , CF、 
HHC、HHM 和 DPW 推荐 结果 多 样 性 上 较 传统 网 络 结构 算法 
了 明显 改善 。 当 实验 数据 量 较 少时 , DPW 算法 的 推荐 结果 多 样 
性 能 力 与 HHC 较为 相似 ， 当 推荐 列表 长 度 增 大 时 ，DPW 算法 
的 多 样 性 推荐 能 力 较 好 。 随 着 实验 数据 量 的 增多 DPW 算法 在 
推荐 结果 多 样 性 上 表现 较 好 。 可 见 随 着 推荐 系统 中 展示 物品 数 
量 增多 以 及 物品 总 数 增多 ，DPW 算法 能 展示 出 更 多 种 类 的 物 


口 
HHo 


传导 (heterogeneous 


Movielens 数 据 集 


Netflix 数 据 集 


EachMovie 数 据 集 


10 20 30 40 50 
L 


10 20 30 40 50 
工 
一 一 NEL HE HM 一 二 DPW 一 上 一 CF 


图 4 平均 海 明 距 离 值 对 比 结 


在 推荐 冷门 物品 的 能 力 上 如 图 5 所 示 ， HHC、HHM 和 
DPW 算法 相 比 传统 的 CF 和 NBI 算法 对 冷门 物品 的 推荐 效果 
上 有 显著 的 改善 。 其 中 DPW 和 HHC 算法 在 推荐 产品 数量 极 少 
时 ， 推 荐 冷门 物品 能 力 较 好 。 随 着 推荐 物品 数量 以 及 系统 中 物 
品 总 数 增多 ， 三 种 较 优 的 算法 的 推荐 冷门 物品 能 力 逐 渐 增 强 。 
当 推荐 物品 数 多 于 22 时 ， DPW 算法 在 多 个 数据 集中 推荐 冷 
门 物品 能 力 表 现 较 好 。 所 以 当 推 荐 物品 数量 较 多 时 , DPW 算法 


他 挫 hr 口 
更 有 可 能 推荐 更 多 的 冷门 物品 。 

Movielens 数 据 集 EachMovie 数 据 集 Netflix 数 据 集 
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235 3 

<ky 25 300 
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图 5 流行 性 值 对 比 结果 
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录用 稿 高 长 元 ， 等 : 基于 差异 路 径 权 重 的 
在 算法 准确 程度 和 推荐 性 能 方面 ， 由 于 本 算法 针对 物品 中 出 一 种 基于 差异 路 径 权 重 的 二 部 图 网 络 结构 推荐 算法 。 实 验 分 
的 资源 量 进行 入 手 ， 在 结果 表示 上 不 是 以 用 户 评分 数 展现 ， 所  ” 析 中 发 现 ， 通 过 用 户 相 似 度 的 引入 ， 可 使 推荐 结果 改变 ， 同 时 
以 不 能 与 其 他 算法 进行 MAE 指 的 比较 。 因 此 ， 本 文 重点 参考 借助 物品 属性 的 相似 性 使 推荐 算法 的 推荐 结果 流行 性 降低 ， 推 
了 算法 的 P、R、Fl 值 进行 算法 性 能 的 衡量 。 由 实验 结果 可 以 ” 荐 质量 进一步 改进 。 实 验 结果 表明 ， 当 系统 推荐 物品 数量 较 多 
看 出 DPW 算法 的 P 和 R 随 着 实验 的 推荐 列表 长 度 增加 准确 程 ” 时 ， 本 文 算法 推荐 物品 种 类 较 丰 富 且 优 于 其 他 几 种 流行 算法 ， 
度 呈 现 渐 好 地 趋势 , 在 数据 量 较 少 的 Movielens 数据 集中 ,DPW ”同时 本 文 算 法 也 能 作用 在 实验 数据 较为 稀 疏 的 情境 中 。 本 文 算 
的 性 能 与 HHC 算法 效果 较为 相似 ， 随 着 实验 数据 量 的 增多 ”法 综合 性 能 与 几 类 主流 网 络 推荐 算法 相 比 有 所 提高 。 同 时 本 文 
DPW 推荐 性 能 逐渐 增强 ， 有 具体 结果 如 图 6、7 所 示 。 算法 通过 降低 推荐 物品 的 流行 性 实现 对 冷门 物品 的 推荐 ， 使 得 
本 文 算法 能 作用 于 个 性 化 推荐 系统 中 。 在 未 来 的 研究 中 ， 针 对 
Movielens 数 据 集 EachMovie 数 据 集 Netflix 数 据 集 i -= 
on on 不 同 的 应 用 场景 本 文 算法 需要 进行 改变 ， 同 时 在 处 理 更 多 量 的 
0.16 0.15 i 
on on 数据 时 ， 算 法 的 工作 效率 也 有 待 提高 。 
p 012 i 
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01 i 
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图 7 Recall 值 对 比 结果 


算法 综合 性 能 上 , DPW 算法 在 推荐 系统 物品 总 量 低 时 表现 


不 稳定 ， 并 且 性 能 略 差 于 HHC 算法 。 随 着 系统 中 物品 总 数 增 
多 以 及 推荐 物品 的 增多 ， 算 法 的 性 能 逐渐 转 好 ， 并 且 在 多 物品 
阶段 的 性 能 较 HHC 和 HHM 算法 都 有 所 提高 ,具体 结果 如 图 8 
所 示 。 

2 Movielens 数 据 集 EachMovie 数 据 集 ee Netflix 数 据 集 
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综合 评价 指标 Fl 值 对 比 结果 


xDPW —#-CF 


图 8 


对 于 DPW 算法 在 推荐 物品 数量 较 少时 ， 没 有 达到 更 优 的 


表现 , 对 Movielens 数据 集 查询 发 现 , 此 数据 库 流行 物品 较 多 ， 
当 推 荐 物品 数量 较 少 时 ， 推 荐 冷门 数量 较 少 。 但 是 在 多 个 数据 
集 的 整体 效果 上 ，DPW 算法 在 推荐 结果 的 多 样 性 和 准确 性 上 ， 
较 目 前 流行 的 网 络 结构 算法 和 协同 过 滤 算 法 有 了 进步 。 
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针对 二 部 图 网 络 结构 推荐 算法 中 资源 均等 分 配 和 传统 推荐 
算法 中 推荐 物品 流行 性 及 推荐 物品 多 样 性 较 弱 的 情况 ， 本 文 提 
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